Henter inn besøkstistikk fra statisk fil hentet fra Google Analytics. Antall ansatte hentes fra statisk fil fra Arbeidstakerregisteret(via Stryk-08)

Besøkstatistikken viser data fra 1. januar til 9. mars per år.

Finner de mest besøkte yrkessidene i 2021 og 2013

Sykepleier, Ingeniør, Psykolog, Lege, Advokat og Helefagarbeider går igjen blant de 10 mest besøkte yrkene både i 2013 og 2021.Dette er statusyrker og/eller knyttet til helse.

##  [1] "Sykepleier"       "Ingeniør"         "Psykolog"         "Eiendomsmegler"  
##  [5] "Lege"             "Sosionom"         "Advokat"          "Siviløkonom"     
##  [9] "Fysioterapeut"    "Helsefagarbeider"
##  [1] "Sykepleier"        "Psykolog"          "Advokat"          
##  [4] "Lege"              "Lærer"             "Ingeniør"         
##  [7] "Ambulansearbeider" "Elektriker"        "Pilot"            
## [10] "Helsefagarbeider"

Ser på utviklingen i besøkssandel fra 2013 til 202 for de mest besøkte yrkene i 2021 og 2013

Sykepleier er det klart mest besøkte yrket (med untak av i 2014 der ingeniør lå høyest). I 2021 har 67 400 (0,85 prosent) besøkt yrketbeskrivelsen. Neste på lista er psykolog med 36 300 (0,46 prosent). Sykepleier nesten dobbelt så mange besøk som psykolog.

## # A tibble: 10 x 4
##    Yrke               year rank_ansatte rank_ansatte_gruppe   
##    <chr>             <int>        <dbl> <chr>                 
##  1 Sykepleier         2021        0.989 Høyt antall ansatte   
##  2 Psykolog           2021        0.820 Høyt antall ansatte   
##  3 Advokat            2021        0.783 Middels antall ansatte
##  4 Lege               2021        0.944 Høyt antall ansatte   
##  5 Lærer              2021        0.995 Høyt antall ansatte   
##  6 Ingeniør           2021        0.993 Høyt antall ansatte   
##  7 Ambulansearbeider  2021        0.754 Middels antall ansatte
##  8 Elektriker         2021        0.923 Høyt antall ansatte   
##  9 Pilot              2021        0.643 Middels antall ansatte
## 10 Helsefagarbeider   2021        0.986 Høyt antall ansatte
## # A tibble: 10 x 4
##    Yrke              year rank_ansatte rank_ansatte_gruppe   
##    <chr>            <int>        <dbl> <chr>                 
##  1 Sykepleier        2013        0.989 Høyt antall ansatte   
##  2 Ingeniør          2013        0.993 Høyt antall ansatte   
##  3 Psykolog          2013        0.820 Høyt antall ansatte   
##  4 Eiendomsmegler    2013        0.801 Høyt antall ansatte   
##  5 Lege              2013        0.944 Høyt antall ansatte   
##  6 Sosionom          2013        0.916 Høyt antall ansatte   
##  7 Advokat           2013        0.783 Middels antall ansatte
##  8 Siviløkonom       2013        0.871 Høyt antall ansatte   
##  9 Fysioterapeut     2013        0.810 Høyt antall ansatte   
## 10 Helsefagarbeider  2013        0.986 Høyt antall ansatte

Eksempel: Yrkesbeskrivelse sykepleier

Se på hvor endring i interesse fra 2013 til 2021 har vært størst

df.4 <- ga_pw_utdanningno_data %>%
  filter(page_views_pst < 1, year == 2021 | year== 2013, page_type == "yrke") %>%
  select(page_title, year, page_views_pst, page_views) %>%
  arrange(desc(page_views_pst))


freq <- data.frame(table(df.4$page_title)) #number of occurences 
yrke.2years <- as.character(freq$Var1[freq$Freq == 2]) #finding ocupations with both years

df.5 <- df.4[df.4$page_title %in% yrke.2years,] #excluding ocupations with only one occurence
   # df.5 <- df.5[order(df.5$page_title),]

df.5.13 <- df.5[df.5$year == 2013,] #object for 2013
  #df.5.13 <- df.5.13[order(df.5.13$page_title),]
    df.5.13 <- arrange(df.5.13, page_title)


df.5.21 <- df.5[df.5$year == 2021,] #object for 2021
      df.5.21 <- arrange(df.5.21, page_title)
      
#test that both years are sorted correct
  all.equal(df.5.13[,1], df.5.21[,1]) #should be true
## [1] TRUE
#new df with difference 2021 and 2013
  diff <- data.frame(df.5.13$page_title, df.5.13$page_views_pst, df.5.21$page_views_pst, df.5.21$page_views_pst-df.5.13$page_views_pst) 
    names(diff) <- c("page_title", "page_views_pst_13", "page_views_pst_21", "increase_page_views_pst")
  diff <- arrange(diff, desc(increase_page_views_pst))
      
diff.1 <- bind_rows(slice_head(diff,n=5), slice_tail(diff, n=5)) #looking only at a few
diff.2 <- bind_rows(slice_head(diff,n=20), slice_tail(diff, n=20)) #looking only at some more 
 View(diff.2)
  
# Plot occupations with largest effect
diff.long <- diff.1 %>% 
            gather("year", "page_views_pst", page_views_pst_13:page_views_pst_21)
      
c <- ggplot(diff.long, aes(x=as.character(year), y=page_views_pst*100, group= page_title)) 
    c + geom_line(aes(color= page_title), size= 1) + xlab("År") + ylab("Prosentandel av sidevisninger") + labs(color= "Yrke", title = "Endring i prosentandel sidevisinger til de yrkene m størst endring fra 2013 til 2021")  

### Ser på utvikling for utdanningsbeskrivelser

dfu.21 <- ga_pw_utdanningno_data %>%
  filter(page_views_pst < 1, year == 2021, page_type == "utdanningsbeskrivelse") %>%
  slice_max(page_views_pst, n=10) %>%
  select(page_title, year, page_views_pst, page_views) %>%
  arrange(desc(page_views_pst))

dfu.13 <- ga_pw_utdanningno_data %>%
  filter(page_views_pst < 1, year == 2013, page_type == "utdanningsbeskrivelse") %>%
  slice_max(page_views_pst, n=10) %>%
  select(page_title, year, page_views_pst, page_views) %>%
  arrange(desc(page_views_pst))

(top10.13u <- dfu.13$page_title)
##  [1] "Sykepleie"                    "Juss"                        
##  [3] "Barnevern"                    "Medisin"                     
##  [5] ""                             "Psykologi"                   
##  [7] "Fysioterapi"                  "Ingeniør"                    
##  [9] "Pedagogikk"                   "Økonomisk-administrative fag"
(top10.21u <- dfu.21$page_title)
##  [1] "Sykepleie"                       "Psykologi"                      
##  [3] "Juss"                            "Økonomisk-administrative fag"   
##  [5] "Sosialt arbeid (sosionom)"       "Videreutdanning for sykepleiere"
##  [7] "Arkitektur"                      "Barnevern"                      
##  [9] "Politiutdanning"                 "Vernepleie"

#Ser på prosentandel av sidevisninger over tid for de mest beøskte utdanningsbeskrivelsene i 2013 and 2021

dfu.1 <- ga_pw_utdanningno_data %>%
  filter(page_views_pst < 1, page_type == "utdanningsbeskrivelse") %>%
  select(page_title, year, page_views_pst, page_views) %>%
  arrange(desc(page_views_pst))

dfu.2 <- dfu.1[dfu.1$page_title %in% top10.21u,]

e <- ggplot(dfu.2, aes(x=as.character(year), y=page_views_pst*100, group= page_title)) 
            
e + geom_line(aes(color= page_title), size= 1) + xlab("År") + ylab("Prosentandel av sidevisninger") + labs(color= "Utdanningsbeskrivelse", title="Utvikling til de mest besøkte Utdanningsbeskrivelsene i 2021")

dfu.3 <- dfu.1[dfu.1$page_title %in% top10.13u,]
b <- ggplot(df.3, aes(x=as.character(year), y=page_views_pst*100, group= page_title)) 
            
b + geom_line(aes(color= page_title), size= 1) + xlab("År") + ylab("Prosentandel av sidevisninger") + labs(color= "Yrke", title="Utvikling til de mest besøkte Utdanningsbeskrivelsene i 2013")  

Se på hvor endringen i interesse har vært størst utdanningsbeskrivelser

dfu.4 <- ga_pw_utdanningno_data %>%
  filter(page_views_pst < 1, year == 2021 | year== 2013, page_type == "utdanningsbeskrivelse") %>%
  select(page_title, year, page_views_pst, page_views) %>%
  arrange(desc(page_views_pst))


freq.u <- data.frame(table(dfu.4$page_title)) #number of occurences 
ut.2years <- as.character(freq.u$Var1[freq.u$Freq == 2]) #finding ocupations with both years NB: Some education programs have 3 or 4 occurences 

dfu.5 <- dfu.4[dfu.4$page_title %in% ut.2years,] #excluding ocupations with more or less occurences
   

dfu.5.13 <- dfu.5[dfu.5$year == 2013,] #object for 2013
     dfu.5.13 <- arrange(dfu.5.13, page_title)


dfu.5.21 <- dfu.5[dfu.5$year == 2021,] #object for 2021
      out <- data.frame(table(dfu.5.21$page_title)) #Helseadminstrasjon comes twice in 2021
      out <- as.character(out$Var1[out$Freq != 1])
      dfu.5.21 <- dfu.5.21[! dfu.5.21$page_title %in% out,]    

dfu.5.21 <- arrange(dfu.5.21, page_title)
      
#test that both years are sorted correct
  all.equal(dfu.5.13[,1], dfu.5.21[,1]) #should be true
## [1] TRUE
#new df with difference 2021 and 2013
  diff.u <- data.frame(dfu.5.13$page_title, dfu.5.13$page_views_pst, dfu.5.21$page_views_pst, dfu.5.21$page_views_pst-dfu.5.13$page_views_pst) 
    names(diff.u) <- c("page_title", "page_views_pst_13", "page_views_pst_21", "increase_page_views_pst")
  diff.u <- arrange(diff.u, desc(increase_page_views_pst))
      
diff.u1 <- bind_rows(slice_head(diff.u,n=5), slice_tail(diff.u, n=5)) #looking only at a few
diff.u2 <- bind_rows(slice_head(diff.u,n=20), slice_tail(diff.u, n=20)) #looking only at some more 
 View(diff.u2)